Model Selection

Fine-grained Local Description

# Fine-grained Local Description

DAM 3B Self Contained

DAM-3B is a vision-language model capable of generating fine-grained local descriptions based on user-specified image regions (points/boxes/sketches/masks).

Image-to-Text English

DAM-3B is a 3-billion-parameter vision-language model capable of generating fine-grained local descriptions for user-specified image regions.

Safetensors English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase